检索结果

Select

1. 各向异性非极大值抑制在工业目标检测中的应用

张诗文, 邓春华, 张俊雯

《计算机应用》唯一官方网站 2022, 42 (7): 2210-2218. DOI: 10.11772/j.issn.1001-9081.2021040648

摘要（192）

HTML （6）

PDF （4149KB）（55）

在某些固定的工业应用场景中，对目标检测算法的漏检容忍性非常低。然而，提升召回率的同时，目标周围容易规律性地产生一些无重叠的虚景框。传统的非极大值抑制（NMS）策略主要作用是抑制同一目标的多个重复检测框，无法解决上述问题。为此设计了一种各向异性NMS方法来对目标周围不同方向采取不同的抑制策略，从而有效消除规律性的虚景框。固定的工业场景中的目标形状和规律的虚景框往往具有一定关联性。为了促进各向异性NMS在不同方向的精确执行，设计了一种比例交并比（IoU）损失函数用来引导模型拟合目标的形状。此外，针对规则目标使用了一种自动标注的数据集增广方法，在降低人工标注工作量的同时扩大了数据集规模。实验结果表明，所提方法在轧辊凹槽检测数据集上的效果显著，应用于YOLO系列算法时在不降低速度的同时提升了检测精度。目前该算法已成功应用于某冷轧厂轧辊自动抓取的生产线。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于骨骼时序散度特征的人体行为识别算法

田志强, 邓春华, 张俊雯

计算机应用 2021, 41 (5): 1450-1457. DOI: 10.11772/j.issn.1001-9081.2020081178

摘要（400）

PDF （2089KB）（829）

人体行为识别是智能监控、人机交互、机器人等领域的一项重要的基础技术。图卷积神经网络（GCN）在基于骨骼的人体行为识别上取得了卓越的性能。不过GCN在人体行为识别研究中存在以下问题：1）人体骨架的骨骼点采用坐标表示，缺乏骨骼点的运动细节信息；2）在某些视频中，人体骨架的运动幅度太小导致关键骨骼点的表征信息不明显。针对上述问题，首先提出骨骼点的时序散度模型来描述骨骼点的运动状态，从而放大了不同人体行为的类间方差。并进一步提出了时序散度特征的注意力机制，以突显关键骨骼点，进一步扩大类间方差。最后根据原始骨架的空间数据特征和时序散度特征的互补性构建了双流融合模型。所提算法在权威的人体行为数据集NTU-RGB+D的两种划分策略下分别达到了82.9%和83.7%的准确率，相比自适应图卷积网络（AGCN）提高了1.3个百分点和0.5个百分点，准确率的提升证明了所提算法的有效性。

参考文献 | 相关文章 | 多维度评价

Select

3. 基于边缘关注模型的语义分割方法

佘玉龙, 张晓龙, 程若勤, 邓春华

计算机应用 2021, 41 (2): 343-349. DOI: 10.11772/j.issn.1001-9081.2020050725

摘要（481）

PDF （1372KB）（634）

肝脏是人体代谢功能的主要器官，目前机器学习在肝脏影像语义分割研究中的难点有：1）肝脏中间部位有下腔静脉、软组织和血管，甚至有坏死或肝裂等情况；2）肝脏与一些邻近器官之间的边界模糊，难以分辨。针对这些问题，提出了边缘关注模型（EAM）及边缘关注网络（EANet）。该网络采用了Encoder-Decoder（编码-解码）的模型框架：在编码器中运用了在ImageNet上预训练好的残差网络ResNet34和EAM，由此来充分获取肝脏边缘的细节特征信息；在解码器中则运用了反卷积操作和EAM对有效信息进行特征提取，进而得到肝脏影像的语义分割图。最后，对分割后噪声较大的图片实施了平滑处理。在三个数据集上与AHCNet进行对比，结果显示：在3Dircadb数据集上，EANet的体积重叠误差（VOE）和相对体积差异（RVD）分别降低了1.95个百分点和0.11个百分点，且DICE精度提高了1.58个百分点；在Sliver07数据集上，EANet的VOE、最大表面距离（MSD）和均方差对称表面距离（RMSD）分别降低了大约1个百分点、3.3 mm和0.2 mm；在某医院临床MRI肝脏影像数据集上，EANet的VOE和RVD分别降低了0.88个百分点和0.31个百分点，且DICE精度提高了1.48个百分点。实验结果表明，所提出的EANet具有较好的肝脏图像分割效果。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于非对称沙漏网络结构的目标检测算法

刘子威, 邓春华, 刘静

计算机应用 2020, 40 (12): 3526-3533. DOI: 10.11772/j.issn.1001-9081.2020050641

摘要（441）

PDF （1337KB）（788）

基于无锚框深度学习的目标检测是一种主流的单阶段目标检测算法。融合多层监督信息的沙漏网络结构能够显著提升无锚框目标检测算法的精度，然而其速度却远低于同层次的普通网络的速度，并且不同尺度目标间的特征会互相干扰。针对上述问题，提出了一种非对称沙漏网络结构的目标检测算法。该算法在融合不同网络层的特征时不受形状大小的约束，能够快速高效抽象出网络的语义信息，使模型更容易学习到各种尺度之间的差异。针对不同尺度目标检测问题，设计了一种多尺度输出的沙漏网络结构用来解决不同尺度目标间特征互相干扰的问题，并精细化输出的检测结果。另外，针对多尺度输出使用了一种特殊的非极大值抑制算法以提高检测算法的召回率。实验结果表明，所提算法在COCO数据集上的AP50指标达到61.3%，相较于无锚框网络CenterNet提升了4.2个百分点。所提算法在精度与时间的平衡上超越了原始算法，尤其适用于对工业场景的目标进行实时检测。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于深度学习的复杂气象条件下海上船只检测

熊咏平, 丁胜, 邓春华, 方国康, 龚锐

计算机应用 2018, 38 (12): 3631-3637. DOI: 10.11772/j.issn.1001-9081.2018040933

摘要（1086）

PDF （1097KB）（871）

为了解决复杂海情环境下的不同种类和大小的舰船检测问题，提出一种实时的深度学习的目标检测算法。首先，提出了一种清晰图片和模糊图片（雨、雾等图片）判别的方法；然后，在YOLO v2的深度学习框架的基础上提出一种多尺度目标检测算法；最后，针对遥感图像舰船目标的特点，提出了一种改进的非极大值抑制和显著性分割算法，对最终的检测结果进一步优化。在复杂海情和气象条件下的舰船目标公开比赛的数据集上，实验结果表明，相比原始的YOLO v2，该方法的准确率提升了16%。

参考文献 | 相关文章 | 多维度评价